查看原文
其他

谈谈运营商、云厂商、初创公司不同视角下的DPU

SDNLAB酱 SDNLAB 2023-03-04

“DPU的出现从技术上来讲是必然的。”

随着数据的爆发性增长,CPU的摩尔定律不再适用,CPU很难满足数据中心的爆炸式需求,DPU作为一个全新的概念,是继CPU、GPU后数据中心的“第三颗芯片”。DPU能够很好地卸载CPU上的网络、虚拟化、存储、安全功能,其作用本质上可以归纳为卸载、加速和隔离:把 CPU 的部分工作卸载到自己身上;利用自己的算力特长,对这些工作进行加速运算;并最终实现了计算的隔离。
DPU雏形最初源自公有云厂商,AWS从2015年开始就已经是DPU发展的早期探索者,但那时还没有“DPU”的概念。直到2019年,由Juniper发起人创建的硅谷创业公司Fungible提出了DPU(数据处理单元,Data Processing Unit)这个概念;2020年,英伟达收购Mellanox并将BlueField产品线更名为Nvidia DPU,并将DPU这个概念更广泛地传向市场,自此,DPU一炮而红。
芯启源DPU产品线产品市场总监胡侃指出,DPU的源起跟业务发展有很大关系,人工智能、大数据等‍‍业务的发展催生了云计算数据中心流量的激增。‍‍DPU最直接的效果就是为CPU减负,承担网络虚拟化、IO虚拟化、存储虚拟化等占用CPU算力但并非直接用于计算的基础设施功能,从而将CPU的算力释放给应用程序。
 

DPU的“好与坏”?

“一颗有竞争力的DPU需要具备灵活可拓展、高度可编程、高性能低功耗、信息安全、自主可控四大核心特征。”胡侃表示。
 
DPU的功能和性能需要能够满足不同的场景需求。一颗所谓的“好”DPU至少要具备高性能、可用性、稳定性,同时还要兼具易用性。“DPU的使用门槛不能太高,此外,现在互联网讲究快速迭代,这就意味着研发周期也不能太长,”天翼云基础架构资深专家邹明补充,DPU厂商对于业务场景的需要有深刻的理解。
 
由于目前DPU的概念和技术标准并未统一,各家从自身优势出发输出相应的解决方案,形成百家争鸣的竞争格局。
 
目前DPU主流的市场方案包括以Arm核为主的架构、FPGA+CPU架构,以及SoC架构,前两者已经在云计算厂商得到批量部署,未来可能会更多地朝着SoC方向发展。目前FPGA+CPU架构用的比较多,与第一代Arm核为主相比,接口的丰富度和处理性能要好很多,但缺点也很明显,FPGA的功耗较大、价格较高、研发成本也相对较高。
 
“但总体来说,DPU基本架构不存在明显的优劣,‍‍DPU创业厂商要做好的技术架构取舍,最关键还是要根据各自的业务需求来综合判断,”胡侃表示。
 

DPU是“万能的”?

目前看来,云计算是DPU的主要应用场景,DPU为云计算遇到的瓶颈问题补齐技术能力和应用功能。DPU还可以用在一些超低时延和超大吞吐的应用上,比如企业级金融、高性能计算、边缘计算、自动驾驶等场景。
 
随着国家启动“新基建”和“东数西算”工程,算力网络发展进入了新时期。CPU处理网络虚拟化消耗大量计算资源,影响服务器的性能。DPU的直接效果就是给CPU“减负”。DPU能针对安全、网络、存储、AI、HPC等业务进行加速。不仅如此,DPU的价值还在于为以数据为中心的计算架构提供了创新的思路,能够实现以前难以或无法实现的功能。
 
无人驾驶、数字货币、VR/AR游戏,这些时髦的词汇无疑对算力是一次全新的考验。未来DPU将在算力网络乃至元宇宙的发展道路上占据一席之地。 
 
“在一定程度上,DPU可以说是‘万能的’。”邹明表示。
 

DPU“方兴未艾”?

DPU的概念最早可以追溯到2015年。2015年云计算巨头AWS收购了芯片厂商Annapurna Labs并于2017年正式推出 Nitro 系统,将网络、存储和安全任务卸载到基于Arm架构的专用设备上。同年,阿里云也官宣了有类似功能的神龙( X-Dragon )架构。这可以说是DPU最早的探索。

纵观国外DPU的发展:

2015年,英特尔收购Altera,并于2021年发布IPU类DPU产品;

Marvell从2018年开始陆续收购了Cavium、Avera Semiconductor和芯片初创公司Innovium;

赛灵思2019年宣布收购Solarflare,2020年发布Alveo系列加速卡产品,2022年又被AMD收购;

Fungible于2019年提出了DPU的概念,后专注于DPU设计;

2020年,英伟达69亿美元收购以色列网络芯片商Mellanox,并将BlueField产品线更名为Nvidia DPU,进一步推动了DPU的发展,而后又以400亿美元收购芯片设计公司ARM;

AMD收购赛灵思以补齐FPGA短板,今年又以约19亿美元收购云服务提供商Pensando,也正式进入DPU领域。

……


国内DPU发展则呈现百花齐放状态:

云厂商中,阿里云今年发布了自己的CIPU;

腾讯云也加入了DPU的研发,自研了水杉和银杉两代DPU;

百度自研了太行DPU;

天翼云以FPGA+CPU的架构作为切入点,成功研发出了天翼云DPU1.0产品;

字节跳动也宣布将自研DPU,计划通过火山引擎云产品的方式对外服务。


此外,国内还涌现了芯启源、云豹智能、中科驭数、云脉芯联、星云智联、大禹智芯、益思芯等一大批DPU初创公司。DPU的热度空前高涨,不少初创企业纷纷拿到巨额融资,背后不乏一些大云厂商的身影。
 
谷歌云亚太区资深产品经理马绍文指出,“国内阿里、腾讯、天翼云等领先的云厂商基本都规划了各自的发展路线,这一定程度上也推动了DPU厂商的创新。国内DPU的发展方兴未艾。”
 

DPU的机遇和挑战?

就目前而言,国产DPU发展面临着很大机遇。相比于已经成熟的CPU、GPU赛道,国内外DPU的发展差距其实并不大,国外DPU赛道以巨头厂商为主,Pensando等DPU创业公司逃脱不了被收购的命运,而国内DPU厂商则呈现百家争鸣状态,加上DPU芯片的需求与高端交换芯片的需求完全不同,DPU芯片对于制程的要求没有那么高,这也给了一众DPU初创公司一颗“定心丸”。此外新基建、“东数西算”的建设也将有力推动国内DPU行业的发展。
 
然而这其中也不乏挑战。
 
DPU很大的一个应用挑战就是跨平台下的适配问题,DPU要与当下的CPU以及各种操作系统进行适配,这非常考验DPU厂商的技术实力。而且加之DPU本身特有的挑战主要有需求比较碎片化、软件生态不够成熟。当然DPU还有一些行业共性的挑战,比如芯片量产供应链的问题和高水平研发人员的短缺问题。
 
胡侃举例,DPU要和服务器协作,服务器的CPU不仅有x86,还有基于ARM的鲲鹏,飞腾,还有海光X86,以及Linux、windows、VMware以及各类国产操作系统,仅适配不同的服务器就是一项庞杂的工作。还有具体业务场景下,如公有云场景下的云平台,SDN控制器等软件适配……DPU落地商用,这是必须要翻越的大山。
 
最后还有标准化的问题。从运营商角度来讲,‍‍他们对于DPU的可维护性、稳定性要求很高。如果没有统一的标准,每个厂商的产品五花八门,那么管理成本自然也会飙升,“除此之外,国内也需要建立自己的DPU开源社区,打造DPU生态。”胡侃补充。
 

DPU:百花齐放、任重道远

DPU目前尚处于刚刚开始起步的发展阶段,但可以确定的是,未来数年内DPU市场在全球将是一片蓝海。当前国内外DPU厂商基本处于相同的发力节点,尤其国内DPU厂商如雨后春笋般不断涌现,呈现‍‍百花齐放之势。纵观整个国产DPU的发展,未来要走路还很长。
 
‍任重而道远,国内DPU厂商需要加强与云厂商、产业链上下游厂商等各方的深度合作,携手打造更好、更开放的DPU生态,为国产DPU以及中国芯片行业的发展添砖加瓦!

【活动专栏】

【转载须知】

若转载文章为原创文章,可在相应文章下或公众号后台留言;其他非转载类文章须在文首以不小于14号字体标明载自SDNLAB

【投稿】

欢迎智能网卡/DPU、SDN、SD-WAN、确定性网络、TSN、5G、网络切片等网络方向的观点类、新闻类、技术类稿件。
联系人:kk__wu(微信号)投稿邮箱:pub@sdnlab.com详情请参考:SDNLAB原创文章奖励


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存